Modul 10 von 15 · 📖 6 min Lesezeit · ⏱ 30 min gesamt

FI-DPA 10 Statistik-Basics für Analysten

Inhaltsverzeichnis (5 Abschnitte)
  1. Konzepte und Hintergrund
  2. Praktische Schritte
  3. Häufige Fallstricke
  4. Weiterführende Ressourcen
  5. Wissens-Check

FI-DPA 10 Statistik-Basics für Analysten

In diesem Modul erwerben Sie die grundlegenden statistischen Kenntnisse, die für die Datenanalyse unerlässlich sind. Sie lernen, wie Sie Daten sinnvoll zusammenfassen und interpretieren können, indem Sie geeignete Lage- und Streuungsmaße anwenden. Zudem erwerben Sie das Verständnis, wie Sie Korrelationen von Kausalität unterscheiden können und Hypothesentests systematisch durchführen.

Konzepte und Hintergrund

Lagemaße
Statistische Werte, die die zentrale Tendenz einer Datensammlung beschreiben. Dazu gehören der Mittelwert (arithmetisches Durchschnitt), der Median (mittlerer Wert in geordneten Daten) und der Modus (häufigster Wert).
Streuungsmaße
Maße, die die Streuung der Daten um den Mittelwert beschreiben. Wichtige Streuungsmaße sind die Varianz (Durchschnitt der quadrierten Abweichungen), die Standardabweichung (Quadratwurzel der Varianz) und der Spannweite (Differenz zwischen Maximal- und Minimalwert).
Korrelation vs. Kausalität
Korrelation beschreibt eine statistische Beziehung zwischen zwei Variablen, besagt aber nicht, dass eine Variable die andere verursacht. Kausalität bedeutet, dass eine Veränderung einer Variable direkt zu einer Veränderung der anderen führt. Korrelation ist notwendige, aber nicht hinreichende Bedingung für Kausalität.
Hypothesentests
Statistische Verfahren, um die Gültigkeit einer Hypothese anhand von Stichprobendaten zu überprüfen. Sie umfassen die Formulierung von Null- und Alternativhypothese, die Berechnung eines Testwerts und den Vergleich mit einem kritischen Wert oder die Berechnung des p-Werts.

Praktische Schritte

  1. Daten vorbereiten und bereinigen, um sicherzustellen, dass sie für die Analyse geeignet sind. Dies beinhaltet das Entfernen von Ausreißern und die Behandlung fehlender Werte.
  2. Berechnen Sie den Mittelwert und Median Ihrer Datensammlung, um die zentrale Tendenz zu bestimmen. Dies gibt Ihnen einen ersten Eindruck von der Verteilung Ihrer Daten.
  3. Berechnen Sie die Standardabweichung, um die Streuung der Daten um den Mittelwert zu quantifizieren. Ein kleiner Wert deutet auf geringe Streuung hin.
  4. Erstellen Sie ein Streudiagramm, um die Beziehung zwischen zwei Variablen visuell zu untersuchen. Dies hilft bei der Identifikation potenzieller Korrelationen.
  5. Berechnen Sie den Korrelationskoeffizienten, um die Stärke und Richtung der linearen Beziehung zwischen zwei Variablen zu quantifizieren. Werte nahe 1 oder -1 deuten auf starke Korrelation hin.
  6. Formulieren Sie klare Hypothesen für Ihren statistischen Test, wobei die Nullhypothese besagt, dass kein Effekt vorhanden ist.
  7. Wählen Sie den geeigneten statistischen Test basierend auf Ihren Daten und Hypothesen, z.B. t-Test für Mittelwertvergleiche oder Chi-Quadrat-Test für kategoriale Daten.
  8. Berechnen Sie den p-Wert, um die Wahrscheinlichkeit zu bestimmen, die beobachteten Daten zu erhalten, wenn die Nullhypothese wahr ist.
  9. Vergleichen Sie den p-Wert mit Ihrem Signifikanzniveau (meist 0.05), um zu entscheiden, ob die Nullhypothese verworfen werden kann.
  10. Interpretieren Sie die Ergebnisse im Kontext Ihrer ursprünglichen Fragestellung und ziehen Sie sachliche Schlussfolgerungen.

Häufige Fallstricke

Weiterführende Ressourcen

Wissens-Check

Vier Fragen zur Selbstkontrolle. Klicken Sie jede Frage an, um die richtige Antwort und Erklärung zu sehen.

Welches der folgenden Streuungsmaße ist in der gleichen Einheit wie die ursprünglichen Daten?
  • A) Varianz
  • B) Standardabweichung
  • C) Spannweite
  • D) Quartilsabstand

Richtige Antwort: B. Die Standardabweichung ist die Quadratwurzel der Varianz und befindet sich in der gleichen Einheit wie die ursprünglichen Daten. Die Varianz ist in quadrierten Einheiten, während Spannweite und Quartilsabstand zwar in der gleichen Einheit sind, aber andere Aspekte der Streuung messen.

Was ist die Hauptunterscheidung zwischen Korrelation und Kausalität?
  • A) Korrelation ist immer linear, Kausalität ist nichtlinear
  • B) Korrelation beschreibt eine Beziehung, Kausalität beschreibt eine Ursache-Wirkung-Beziehung
  • C) Korrelation kann nur zwischen numerischen Variablen existieren, Kausalität auch zwischen kategorialen
  • D) Korrelation ist immer positiv, Kausalität kann auch negativ sein

Richtige Antwort: B. Korrelation beschreibt lediglich, dass zwei Variablen zusammen variieren, während Kausalität bedeutet, dass eine Veränderung einer Variable direkt zu einer Veränderung der anderen führt. Korrelation ist notwendige, aber nicht hinreichende Bedingung für Kausalität.

Welches Lagemaß ist am robustesten gegenüber Ausreißern?
  • A) Mittelwert
  • B) Modus
  • C) Median
  • D) Arithmetisches Mittel

Richtige Antwort: C. Der Median ist der mittlere Wert in geordneten Daten und wird nicht von extremen Werten (Ausreißern) beeinflusst. Der Mittelwert und das arithmetische Mittel sind identisch und werden stark von Ausreißern beeinflusst, während der Modus zwar auch robust ist, aber nicht immer einzigartig definiert ist.

Was ist der erste Schritt in einem systematischen Hypothesentest?
  • A) Berechnung des p-Werts
  • B) Formulierung der Null- und Alternativhypothese
  • C) Auswahl des Signifikanzniveaus
  • D) Berechnung des Teststatistik

Richtige Antwort: B. Zuerst müssen die zu testenden Hypothesen klar formuliert werden. Erst danach können Signifikanzniveau und Teststatistik ausgewählt und berechnet werden, und schließlich der p-Wert bestimmt werden.